LINGUISTIQUE - Les langues dans le monde


LINGUISTIQUE - Les langues dans le monde
LINGUISTIQUE - Les langues dans le monde

Six mille cinq cents langues environ sont parlées sur la Terre. Dans l’impossibilité de décider si deux parlers sont des langues distinctes ou des dialectes d’une même langue, on ne saurait être plus précis. Toutes ces langues ont un intérêt égal aux yeux du linguiste. Mais, d’un point de vue géopolitique, une onzaine seulement ont une importance mondiale et sont à elles seules parlées par plus de trois milliards d’hommes, soit la moitié de la population du monde. Encore faut-il préciser qu’il s’agit souvent de familles de langues plutôt que d’idiomes parfaitement unifiés: famille chinoise (1,1 milliard), famille indienne indoeuropéenne (565 millions), anglais (450 millions en 1re langue), espagnol (352 millions, dont 266 millions en 1re langue), russe et biélorusse (294 millions, dont 1re langue: 170 millions), portugais (175 millions), arabe (150 millions), malais ou bahasa indonesia (125 millions, dont 35 millions en 1re langue), français (122 millions), japonais (120 millions), allemand (118 millions).

On parle souvent de langues mères et de langues filles: il y a là une métaphore dangereuse; nul point du temps ne marque précisément le passage de l’une à l’autre. La filiation linguistique est une construction de l’esprit; la seule réalité observable est un processus insensible de diversification (et aussi, inversement, d’unification: par exemple la formation du français standard); ce n’est qu’avec le recul de l’histoire que l’on peut définir, avec quelque arbitraire, des «familles» de langues; cette parenté vaut ce que valent les diverses méthodes de reconstruction utilisées: méthode dite de reconstruction interne, méthode comparative, glottochronologie.

1. La répartition des langues dans le monde actuel

On considère que la guóy face="EU Caron" ズ, «langue nationale» de Chine (le mandarin du Nord) est comprise par 885 millions de locuteurs. Il ne faut pas oublier que la Chine comporte 8 p. 100 de citoyens (soit plus de 100 millions de locuteurs) parlant des langues maternelles n’appartenant pas à la famille chinoise; ils sont membres d’ethnies «minoritaires» au nombre (officiel) de cinquante-cinq, mais représentent en réalité plus de quatre-vingts langues de diverses familles (miao-yao, tai, tibéto-birman, altaïque, austro-asiatique, austronésien). Au contraire, certaines des langues de l’Inde appartenant au groupe indo-européen seraient mutuellement intelligibles (hindi, bihari). Il est dangereux de faire état de statistiques qui ne précisent pas si une langue donnée est la langue première («maternelle») des sujets ou une langue seconde («véhiculaire»). On notera que le hindi, langue maternelle de 180 millions de personnes, est, comme le mandarin, une langue véhiculaire comprise, pour ce qui la concerne, par 367 millions d’Indiens. Dans le groupe malais-javanais-sundanais, l’intercompréhension n’est pas exclue, ce qui n’est pas le cas dans la famille arabe: un Égyptien ne comprend pas un Algérien non versé en arabe classique. Ces réserves faites et en rectifiant «mandarin» à la place de chinois, «hindi» à la place de famille indienne, en considérant l’arabe comme un tout, on reste près du chiffre de 3 milliards de locuteurs (3 158 millions exactement) pour onze langues.

Ces onze langues doivent en partie leur importance au fait qu’elles sont des langues véhiculaires, c’est-à-dire internationales, servant à la communication entre des gens qui pratiquent ordinairement une autre langue. Tel est par exemple le rôle de l’anglais en Inde ou du français en Afrique occidentale. L’Afrique possède trois très grandes langues véhiculaires: le haoussa, le swahili, le fulfuldé. La haoussa est parlé par 35 millions de locuteurs, dont 22 millions comme langue maternelle (au Nigeria principalement); le swahili est parlé par 30 millions d’Africains de l’Est; le fulfuldé (anciennement appelé peul ou fulani) est parlé par un nombre indéterminé d’Africains de l’Ouest, dont 7 600 000 environ au Nigeria. En Océanie, notamment en Nouvelle-Guinée, le pidgin (tok pisin , ou talk pidgin ) est parlé par 2 millions de locuteurs en milieu urbain; cette langue n’a que 50 000 locuteurs en tant que langue maternelle.

On trouvera dans le tableau qui suit un panorama des langues dans le monde actuel, présentées par familles génétiques avec les sous-groupes que peuvent constituer certaines langues dans ces familles, une localisation géographique et quelques indications statistiques. Pour l’Amérique, on distingue généralement beaucoup plus de familles que l’on n’en a présenté ici, mais il a fallu schématiser; en ce qui concerne les langues d’Amérique du Nord et centrale, on a suivi le classement de Gleason, ce qui donne les douze familles suivantes: eskimo-aléoute, algonkin, natchez-muskogee, iroquois, sioux, caddo, tunica, mosan, hokan, maya, uto-aztèque et athabasque. Pour l’Amérique du Sud, aucun classement n’étant encore satisfaisant, on a présenté dans un ordre arbitraire les langues les plus répandues.

2. Classement génétique

Principes

Il convient de présenter d’abord quelques principes:

1) principe de la continuité: les langues ne connaissent pas de mutations brusques; parler de langues «filles» ou «mères» est donc une métaphore inexacte;

2) principe de la constance des lois phonétiques: les lois phonétiques ne souffrent pas d’exception; «si une articulation est conservée dans un mot, elle est conservée également dans tous les mots de la langue où elle se présente dans les mêmes conditions» (A. Meillet);

3) principe de l’indépendance de la parenté génétique: les ressemblances typologiques sont d’un tout autre ordre; par exemple, du point de vue de la morphosyntaxe, l’anglais est bien plus proche du chinois que du français; pourtant, l’anglais n’a aucun lien génétique avec le chinois, c’est une langue cousine du français;

4) principe de la constance d’un certain noyau lexical, non susceptible d’être emprunté d’une langue à l’autre (c’est le principe de la glottochronologie, dite aussi statistique lexicale).

Les deuxième et quatrième principes sont contestés.

Méthodes de reconstruction

On distingue généralement la méthode de reconstruction interne, dialectologie, la comparaison avec d’autres langues et la glottochronologie.

Reconstruction interne

La méthode de reconstruction interne est fondée sur l’hypothèse que des événements dans l’histoire d’une langue ont laissé des traces dans son aspect actuel; on utilise donc ces traces comme sources d’inférences en vue de dégager leurs origines. Employer cette méthode, c’est essayer de reconstruire le prototype d’une langue donnée sans utiliser d’autres informations que celles que contient cette langue. Pour la méthode de reconstruction interne, les alternances morphologiques dégagées synchroniquement sont souvent les indices d’un changement diachronique. Les formes «il est», «ils sont» du verbe «être», où -t et -ont se laissent identifier comme des désinences (fai-t , f-ont ) et où es- et s- représentent deux formes alternantes de la même racine, pourraient nous permettre de poser un état de langue disparu où au singulier l’accent portait sur la racine, d’où la conservation de la voyelle e de es- , et où au pluriel l’accent portait sur la désinence, d’où la chute de la voyelle radicale dans s- et le maintien de la voyelle o de la désinence -ont .

La méthode comparative

Le procédé le plus simple est de collationner dans diverses langues des formes ressemblantes ayant des sens analogues et de postuler une origine commune. Mais il faut bien distinguer les cas d’emprunt ou de développements parallèles. Voici deux exemples célèbres du second cas: la même forme /bad/ a en anglais et en persan le même sens: «mauvais»; mais l’origine de /bad/ anglais est différente de celle de /bad/ persan; on est tenté de rapprocher l’allemand haben (avoir) du latin habere (avoir), mais la phonétique historique indique que l’allemand haben a pour origine /kabhe:/ en proto-germanique, tandis que le latin habere a pour ancêtre /ghabhe:/. Des ressemblances d’ordre grammatical constituent aussi des pièges: la désinence de deuxième personne du singulier -st est commune au vieil anglais et au vieil allemand (thinkest, denkest : «tu penses»), mais on ne peut pas postuler en protogermanique l’existence de cette désinence particulière; en réalité, le germanique commun avait régulièrement à l’indicatif présent la désinence -s pour la deuxième personne du singulier; le -t final des formes citées plus haut provient du pronom de deuxième personne issu de l’indo-européen tu postposé aux verbes déjà munis de leur suffixe -s : vieil allemand denke-s du denkest .

On peut montrer comment la méthode comparative permet une reconstruction phonologique et grammaticale de la langue mère.

Reconstruction phonologique

À titre d’exemple, on a pu reconstruire les consonnes du protoalgonkin central; soit une liste de correspondances lexicales pour quatre langues de ce groupe: fox, cree, menomini, ojibwa (liste 1). En notant que les mots fox sont plus longs que les autres et que les mots ojibwa sont les plus brefs, on peut supposer soit que le fox en évoluant a acquis des suffixes, soit que l’ojibwa a perdu des voyelles finales. La seconde hypothèse est la plus probable, car la plus simple (elle est vérifiée par ailleurs). On définira la consonne initiale /p/ du protoalgonkin comme représentant la correspondance /pppp/ pour fox, cree, menomini et ojibwa. On définit de même /m/, /t/, /s/, /w/, /y/, /k/ et /n/. Pour cette dernière consonne, une autre liste de correspondances vient corriger l’hypothèse (liste 2).

Dans la liste 1, /n/ représentait pour les quatre langues /nnnn/; dans la liste 2, on a par ailleurs les correspondances /ntnn/ et /nynn/ symbolisées respectivement par / / et /1/. On reconstruit: /a emwa, ni emwa, elenywa, lehlewa/. Une langue du même groupe, l’arapaho, a / / et /1/ pour ces correspondances.

Un deuxième exemple concerne la reconstruction du germanique commun. Soit cinq langues pour lesquelles on dispose de documents anciens: gotique, vieil islandais, vieil anglais, vieux saxon et vieux haut allemand. Soit le mot signifiant «poisson» au nominatif singulier; on a respectivement: isks/, iskr isk/, isk/, isk/. La correspondance ffff/ est renforcée par d’autres listes de mots «cognats» ou apparentés potentiels (liste 3). En prenant successivement les différents sons du mot isks/, et en comparant avec d’autres séries de cognats, on établit les correspondances /iiiii/, /sssss/, /kkkkk/ (liste 4). En gotique et en vieil islandais, il y a une finale qui n’apparaît pas dans les trois autres langues pour le mot correspondant à l’anglais fish actuel: on a respectivement -s et -r ; on écrira les correspondances comme ceci: /s,r,-,-,-,/, le tiret indiquant la finale zéro pour le vieil anglais, le vieux saxon et le vieux haut allemand. Cette correspondance est attestée par ailleurs, et représente la désinence du nominatif singulier (au masculin, liste 5).

Les récurrences que l’on vient d’observer sont tellement régulières qu’il est hautement improbable qu’il s’agisse là de coïncidences fortuites ou d’emprunts; on conclut donc que ces langues sont apparentées, et l’on reconstruit pour le germanique commun les sons /, /i/, /s/, /k/, en leur attribuant valeur phonologique sans préjudice de leurs réalisations phonétiques particulières.

Les faits, en général, ne sont pas aussi simples que ceux qui viennent d’être pris comme exemples. On est souvent amené à établir des correspondances entre des formes qui, à première vue, ne concordent que par

le sens; c’est le cas célèbre de l’arménien erku (deux) et du grec duo (deux). Or, à un groupe initial dw- du grec correspond en arménien un groupe -rk- précédé de e- prothétique: grec dwaron (longtemps), arménien erkar (long); grec dweyos (crainte), arménien erkncim (je crains). En outre, comme l’écrivait A. Meillet, «les correspondances sont les seuls faits positifs, et les “restitutions” ne sont que les signes par lesquels on exprime en abrégé les correspondances». C’est dans cette perspective qu’il faut considérer le tableau des consonnes de l’indo-européen, tel qu’on le trouve dans les travaux de Meillet et de Brugmann: quatre séries (sourde, sonore, et l’une et l’autre aspirées), et cinq ordres: labiales (p, b, ph, bh), dentales (t, d, th, dh), palatales (k’, g’, kh’, gh’), vélaires (k, g, kh, gh) et labiovélaires (kw, gw, khw, ghw).

Les travaux de Jerzy Kurylowicz tendent à réduire ce tableau de vingt consonnes, et à en exclure les sourdes aspirées (ph, th, kh). Les désaccords sur les voyelles de l’indo-européen sont plus graves. Les trois voyelles brèves posées par Brugmann (e, o, a) ne sont pas satisfaisantes. Le a possède un statut différent de e et o , car il n’apparaît pas dans les alternances morphonologiques du type lego/logos : «je dis/discours» (grec), ou tego/toga : «je couvre/toge» (latin). Afin de compléter le tableau brugmannien, André Martinet propose de postuler un phonème représenté par /Aw/, «complexe phonologique comprenant rétraction de la langue et arrondissement des lèvres». Cette hypothèse permet de montrer pourquoi les racines se terminant par la laryngale face=F3210 易3 montrent une tendance à développer un /w/ devant voyelle subséquente; par exemple, la racine de face=F3210 易理 (donner): cypriote dowenai ; sanskrit davane ; latin octo/octavus (huit/huitième).

Reconstruction grammaticale

L’indo-européen, pour lequel les travaux sont le plus avancés, comprenait huit cas: nominatif, vocatif, accusatif, génitif, datif, instrumental, locatif et ablatif. Ces cas se sont réduits à cinq en grec ancien, à six en germanique commun, et ont disparu dans les langues romanes ou en anglais actuel, tandis qu’ils subsistent en grande partie dans les langues slaves. Les catégories verbales reconstruites pour l’indo-européen sont le mode (indicatif, subjonctif, optatif), la voix (actif, passif, moyen), l’aspect (procès pur et simple, se développant, inchoatif, accompli, causatif, désidératif).

Glottochronologie

Quand on ne dispose pas de documents écrits, qui permettent des études relativement commodes dans le domaine de la reconstruction de l’indo-européen, du chinois archaïque commun ou du vieux japonais, il est très difficile d’avancer des hypothèses correctement vérifiables. Pourtant, le principe qui fonde la glottochronologie (une certaine persistance d’un fond commun lexical) a une réelle plausibilité, et, malgré les nombreuses critiques qui lui ont été adressées, il reste que l’on ne dispose pas d’autre moyen de datation quand on veut établir des chronologies concernant la filiation de langues sans écriture. Pour calculer la durée pendant laquelle deux langues ont divergé l’une de l’autre, on emploie la formule:

d est la durée, c le vocabulaire commun aux deux états de langue et r le taux de rétention. Pour une liste de deux cent quinze notions communes aux deux langues, le portugais moderne a retenu par millénaire 82 p. 100 des mots du latin classique correspondant à la liste.

Une liste d’une centaine de notions due aux linguistes anglo-saxons est utilisée pour des calculs de datation: tout, cendres, écorce, ventre, grand, oiseau, mordre, noir, sang, os, brûler, nuage, froid, venir, mourir, chien, boire, sec, oreille, terre, manger, œuf, œil, graisse, plume, feu, poisson, voler (dans l’air), pied, donner, bon, vert, cheveu, main, tête, entendre, cœur, moi, tuer, savoir, feuille, être couché, foie, long, pou, homme, beaucoup, viande, montagne, bouche, nom personnel, cou, nouveau, nez, ne... pas, un, humain, pluie, rouge, route, racine, sable, voir, graine, être assis, peau, dormir, petit, fumée, être debout, étoile, pierre, soleil, nager, queue, cela, ceci, tu, trois, langue, dent, arbre, deux, marcher, chaud, eau, nous, quoi?, blanc, qui?, femme, jaune, sein, griffe, pleine corne, genou, lune, rond.

Les critères de choix de ces notions sont les suivants: elles doivent être d’usage courant, universelles (répandues dans toutes les cultures) et résistantes à l’emprunt. Contre la liste utilisée par les tenants de la glottochronologie, deux arguments en particulier ont été avancés: il n’est pas évident que les noms de parties du corps soient parmi les plus stables (ces noms sont souvent l’objet de tabous qui provoquent des dénominations nouvelles); les noms de couleurs du grec moderne ont tous été empruntés (ceux du grec ancien ne sont pas attestés, ce qui fausse le bon usage des calculs).

Encyclopédie Universelle. 2012.

Regardez d'autres dictionnaires:

  • Langues du Nigeria — Langues du Nigéria Langue officielle anglais Langues majeures haoussa, igbo, yoruba Langues mineures peul, kanouri, ibibio, idoma, urhobo, edo, ijaw, tiv, igala …   Wikipédia en Français

  • Langues de Sao Tomé-et-Principe — Langue officielle portugais sãotomense principense Langues nationales Langues inter ethniques Langues étrangères L État insulaire de Sao Tomé et Prin …   Wikipédia en Français

  • Langues du Cap Vert — La langue officielle du Cap Vert est le portugais. Liens externes (fr)Aménagement linguistique dans le monde/ Cap Vert Langues d Afrique Pays Afrique du Sud · …   Wikipédia en Français

  • Langues d'Afrique du Sud — Distribution des langues dominantes en Afrique du Sud. Est dominante la langue parlée à la maison par plus de 50 % de la population ou par plus de 33 % si aucune autre langue n atteint plus de 25 %.… …   Wikipédia en Français

  • Langues du Cap-Vert — La langue officielle du Cap Vert est le portugais. Le Créole du Cap Vert est cependant largement pratiqué. Liens externes (fr)Aménagement linguistique dans le monde/ Cap Vert …   Wikipédia en Français

  • Langues du Botswana — La langue officielle du Botswana est l anglais. Le tswana est la langue usuelle. Lien externe (fr)Aménagement linguistique dans le monde/ Botswana …   Wikipédia en Français

  • EF Séjour Linguistique — Création 1965 modifier  …   Wikipédia en Français

  • Consonne pulmonique — Une consonne pulmonique est une consonne dont la production nécessite un flux d air provenant des poumons. C est le cas de la majorité des consonnes des langues dans le monde. Voir aussi Clic Consonne éjective Consonne injective v …   Wikipédia en Français

  • Iu mien — Parlée en Chine, Birmanie, Laos, Thaïlande, Viêt Nam, Canada, États Unis, Europe, Nouvelle Zélande, Taïwan Nombre de locuteurs 818 635[1] …   Wikipédia en Français

  • Malayâlam — Malayalam Malayâlam മലയാളം Parlée en Inde et Singapour Région Asie Nombre de locuteurs 36 millions Typologie SOV [1] …   Wikipédia en Français

  • Malayāḷaṃ — Malayalam Malayâlam മലയാളം Parlée en Inde et Singapour Région Asie Nombre de locuteurs 36 millions Typologie SOV [1] …   Wikipédia en Français